home *** CD-ROM | disk | FTP | other *** search
/ Collection of Internet / Collection of Internet.iso / infosrvr / dev / www_talk.930 / 000564_timbl@www3.cern.ch _Thu Jan 14 09:26:54 1993.msg < prev    next >
Internet Message Format  |  1994-01-24  |  2KB

  1. Return-Path: <timbl@www3.cern.ch>
  2. Received: from dxmint.cern.ch by  nxoc01.cern.ch  (NeXT-1.0 (From Sendmail 5.52)/NeXT-2.0)
  3.     id AA09959; Thu, 14 Jan 93 09:26:54 MET
  4. Received: by dxmint.cern.ch (5.65/DEC-Ultrix/4.3)
  5.     id AA05709; Thu, 14 Jan 1993 09:42:06 +0100
  6. Received: by www3.cern.ch (NX5.67c/NX3.0S)
  7.     id AA00242; Thu, 14 Jan 93 09:41:13 +0100
  8. Date: Thu, 14 Jan 93 09:41:13 +0100
  9. From: Tim Berners-Lee <timbl@www3.cern.ch>
  10. Message-Id: <9301140841.AA00242@www3.cern.ch>
  11. Received: by NeXT.Mailer (1.87.1)
  12. Received: by NeXT Mailer (1.87.1)
  13. To: Thomas A. Fine <fine@cis.ohio-state.edu>
  14. Subject: Re: web roaming robot (was: strategy for HTML spec?)
  15. Cc: www-talk@nxoc01.cern.ch
  16. Reply-To: timbl@nxoc01.cern.ch
  17.  
  18. Tom,
  19.  
  20. Great idea, LOTS of applications.  Traversing a tree to a given depth
  21. makes a book.  Tony's WWWVeronica is a great idea -- particularly as  
  22. it can pick up WAIS indexes and Gopher and telent sites all together  
  23. and make a megaIndex of the whole scene!
  24.  
  25. Implementation ideas:   The WWW library anchor object actually keeps  
  26. track of every anchor visited.   It uses a hash table to speed up the  
  27. generation of new names.  The HTAnchor_findParent or somesuch routine  
  28. find it if it exists otherwise creates it.  You just need a return  
  29. code to tell you whether you have a new one or not, whether to  
  30. truncate the search there.
  31.  
  32. You could use the HTRules translation table for controlling the  
  33. domain of search.  Useful things to do with the search  are
  34.  
  35. 1. list all references OUT of the domain from within it
  36.     For example, find all telnet sites listed in Hytelnet.
  37.     List all WAIS indexes mentioned in the Web's WAIS catalogue.
  38. 2. list all referencs within, depth-first, with depth indication
  39.     This can drive a book-making script
  40. 3. Apply command to everything within the domain
  41.     for checking
  42.     etc etc
  43.  
  44. I even wondered about putting the traverse code into the library do  
  45. that arbitrary browsers could use it.  It would generate a hypertext  
  46. list of all objects found for example.
  47.  
  48. Tim